Das mysteriöse KI-Easter Egg im Herzen von Ari Asters „Eddington“

Der neue Film „Eddington “ des Horror-Wunderkinds Ari Aster hat das Publikum gespalten und zahlreiche Online-Debatten darüber ausgelöst, was der Regisseur genau über unser kollektives Verhältnis zur Technologie aussagen will (Hinweis: wahrscheinlich nicht gut). Die Geschichte dreht sich um eine Kleinstadt in Texas, die während der Covid-19-Pandemie im Social-Media-Chaos versinkt. Joaquin Phoenix spielt den örtlichen Sheriff Joe Cross, der sich mit dem Bürgermeister der Stadt, gespielt von Pedro Pascal, anlegt, während der Rest der Gemeinde wegen verschiedener politischer und kultureller Streitigkeiten den Verstand verliert.
Die Geschichte des Films ist komplex und voller Nebenhandlungen, doch einer der spannendsten Handlungsstränge dreht sich um die umstrittene Errichtung eines neuen Rechenzentrums nahe der Stadtgrenze. Das Unternehmen hinter der ominösen neuen Anlage trägt einen höchst merkwürdigen Namen: SolidGoldMagikarp. Wie sich herausstellt, scheint dieser Name eine Anspielung auf ein relativ unbekanntes Konzept aus der Entwicklung künstlicher Intelligenz zu sein, das als „Glitch Tokens“ bekannt ist.
Beim KI-Training umfasst der Prozess der „Tokenisierung“ die Übersetzung menschlicher Texte in numerische Daten, die vom LLM interpretiert werden können. Dazu füttern Forscher riesige Mengen menschlicher Texte mit Softwareprogrammen, sogenannten „Tokenizern“. Tokenizer übersetzen die Rohdaten von für Menschen verständlichen Daten in für Maschinen optimierte Daten, sogenannte „Tokens“. Diese Tokens werden dann während des Trainings in ein Sprachmodell eingespeist. Im Trainingsprozess wird einem Algorithmus die Interaktion mit einem Menschen beigebracht – so lernen Chatbots wie ChatGPT, auf menschliche Eingaben zu reagieren und eine Ausgabe bzw. Antwort zu erzeugen.
Die Tokenisierung kann für Unternehmen finanzielle Vorteile mit sich bringen, da sie die Verarbeitung großer Datenmengen effizienter und kostengünstiger macht. Ein Tokenizer lässt sich treffend mit einem Software-Compiler vergleichen, der menschliche Eingaben in einen für einen Computer verständlichen Binärcode übersetzt.
Große Sprachmodelle sind nichts weiter als prädiktive Algorithmen, die Sprache auf der Grundlage menschlicher Eingaben konstruieren. Wie die Autokorrektur ist ChatGPT darauf ausgelegt, Wortfolgen zu lernen und sie wiederzugeben. „Das ist buchstäblich alles, was sie tun“, sagte Jessica Rumbelow, CEO des KI-Unternehmens Leap Labs, gegenüber Gizmodo. „Sie geben also 1, 2, 3, 4 ein, und das Modell ist darauf trainiert, 5 vorherzusagen“, nannte sie als Beispiel.
Token, die während des KI-Trainingsprozesses in LLMs eingegeben werden, sind ein entscheidender Bestandteil, um einem Programm beizubringen, mit Menschen zu kommunizieren. Es gibt jedoch eine wichtige Ausnahme von dieser Regel: das Phänomen der „Glitch-Token“. Rumbelow sagte, dass das Token-System „normalerweise sehr gut funktioniert, außer wenn man Token hat, die das Modell noch nie zuvor gesehen hat“. Wenn ein LLM auf ein Token stößt, mit dem es nicht trainiert wurde, kann dies zu sehr merkwürdigem Verhalten im Programm führen.
SolidGoldMagikarp ist ein solcher „Glitch-Token“, der in der Vergangenheit zu bizarrem Verhalten in LLMs geführt hat. Rumbelow muss es wissen. Sie und ihr Forschungspartner Matthew Watkins entdeckten diesen speziellen Glitch-Token, als sie das Phänomen der anomalen Token untersuchten. Rumbelow sagt, dass die Eingabe des Tokens in das LLM bizarre Ergebnisse lieferte. Das Programm kann Unsinn plappern, indirekte, bedrohliche Sätze und Gefühle äußern oder sich dem Benutzer gegenüber anderweitig aggressiv und feindselig verhalten.
„Wir glauben, dass dies passiert, wenn das Modell dieses Token während des Trainingsprozesses nicht gesehen hat“, sagte Rumbelow. Die KI „weiß nicht, was sie mit der Eingabe anfangen soll“, weil sie sie noch nie zuvor gesehen hat, sagte sie.
Achtung: Spoiler voraus!Kurz gesagt: Ausdrücke wie „SolidGoldMagikarp“ sind obskure Äußerungen, die ein KI-Modell vorübergehend verrückt machen können. Wie passt „SolidGoldMagikarp“ zu den Themen von Asters neuem Film? Das kann jeder nur vermuten, aber man könnte leicht mehrere Interpretationen wagen.
Es ist erwähnenswert, dass Asters Filme trotz ihrer Vielfalt alle ziemlich gleich enden. Jeder Film endet damit, dass die Mächte der Finsternis über den Protagonisten der Geschichte triumphieren. In jedem Fall wird die Figur Teil der verschwörerischen Pläne der dunklen Macht. In „Hereditary“ wird die Familie Graham zu hilflosen Schachfiguren in einer dämonischen Zeremonie eines Hexenzirkels. In „Midsommar“ wird Danis unterdrückte Wut vom Hårga als Waffe gegen ihren Freund eingesetzt. In „Beau hat Angst“ gelingt es der Titelfigur nicht, dem erstickenden Netz seiner Mutter zu entkommen, und ihr gesamtes Leben wird zur Grundlage eines kafkaesken Demütigungsrituals.
In Eddington – einem Film über unser problematisches Verhältnis zur Technologie – ist das Internet selbst die siegreiche dunkle Macht, und die Einwohner der Stadt – insbesondere Joe – geraten in seine datengetriebenen Machenschaften. Das Rechenzentrum, die physische Manifestation der Dominanz des Internets über unser Leben, ist der eigentliche Gewinner des Films, und alle menschlichen Charaktere werden zu seinen Abgesandten, Schachfiguren oder Opfern. Asters Entscheidung, das Rechenzentrum nach einem abtrünnigen Wort zu benennen, das durch eine Art digitale Beschwörung ein ansonsten gesundes System aus dem Gleichgewicht bringen kann, ist möglicherweise seine Art, darauf hinzuweisen, was die Technologie uns allen angetan zu haben scheint, während sie unser Leben übernimmt, und es ist wahrscheinlich eine Warnung vor den kommenden Ereignissen.
gizmodo